扑克策略:平衡的艺术与人工智能的启示

在这篇文章系列的第一部分中,我们讨论了这样一个事实,即绝大多数扑克玩家诈唬的频率不够高。
因此,他们的下注行为通常代表“诚实”(好牌)而不是“不诚实”(诈唬)。这促使我引入了所谓的诚实原则。
诚实原则:总的来说,扑克界诈唬的频率远低于应有的水平。
另一方面,像Libratus这样的**人工智能**,是卡内基梅隆大学的创造,最近设法击败了一些世界上顶尖的无限注玩家。今天,我们将看看Libratus玩的一个疯狂的牌局,看看我们能从它的策略中学到什么。
欢迎来到机器
Libratus策略的核心是机器弥合了下注和诈唬之间的差距,这使得人类玩家很难猜测哪个是哪个。人工智能比人类更加平衡。因此,人类很难判断机器的手牌。
以下是Libratus带来的复杂程度的一个例子。在一次采访中,与Doug Polk,Daniel McAulay描述了他与计算机玩的一个疯狂的牌局。
计算机有5♣ 3♣,Daniel持有X♥Y♥(Daniel的具体牌在这里并不重要)。Daniel在位置上加注,Libratus 3-bet,Daniel 4-bet,最后Libratus在位置外跟注。
我们已经看到Libratus的一些非直观的玩法。大多数人每次都会盖牌,或者可能会做一个5-bet诈唬。从位置外跟注似乎是一个输的玩法,除非下注的玩家有能力在未来做出一些“肮脏”的下注。而Libratus有这个能力!
翻牌是K♥Q♥J♣。Libratus过牌,Daniel用他的同花听牌过牌。
转牌是第三张♥,给了Daniel同花。Libratus过牌,Daniel再次过牌以迷惑对手。
河牌是一张砖(类似于5♠),Libratus用他可怜的一对下注。Daniel小额加注,使其看起来像一个诈唬,果然Libratus全押,将他的底对变成了诈唬!Daniel当然跟注了,并赢得了这手牌。
然而,Libratus输掉这手牌是次要的。计算机采取的路线是接近疯狂的路线,几乎没有人能够做到,尤其是知道他们代表非常狭窄范围的赢家,考虑到他们在转牌和河牌中的被动性。
这正是重点。一个完全平衡的玩家可以在任何情况下,以最佳的频率出现任何东西。请注意,平衡和最优性是这里的关键。例如,人类玩家可能会尝试采取他们可能认为“随机”的行动。然而,在现实中,这些行动通常存在很大偏见。我们人类还没有找到在两者之间找到细微差别的方法。
如果上面的牌局看起来有点超出你的理解范围,你并不孤单。面对Libratus的顶级职业选手也有同样的感觉,并且他们之间有数百万(如果不是数千万)手的扑克经验。我在这里介绍它只是为了说明人类不可能达到这种完美的平衡的不可预测性;一种精细的混合,让对手猜测,同时在这个过程中获利。
我们应该花一点时间来欣赏一下这有多难。
例如,对于Bob来说,永远不诈唬,从而一直完全诚实和可预测是很简单的。对于Bob来说,不断地诈唬也很容易,因此再次可预测地不可预测,因为现在对手会正确地认为他的下注相当弱。在这两种情况下,Bob的对手Alice都会知道会发生什么,因此她可以相应地调整她的策略(简单地对第一种情况进行大量盖牌,并对第二种情况进行反击)。
困难的是Bob找到诈唬和不诈唬之间的细微差别,这样Alice就不再有一个明确的决定。任何低于此标准的东西,都会使他变得过于诚实或过于不诚实,这两者都容易被像Alice这样非常专注的玩家所利用。
编者注
如果您想学习人工智能用来击败世界级玩家的一些具体战术和策略,您应该查看Doug Polk的Brains vs AI分析课程。
这个6小时的课程让你近距离观看Doug对Libratus玩过的牌局的分析。你将学习人工智能如何在单加注底池、3-bet底池、4-bet底池中打牌,它如何处理limping等等。
点击这里了解更多 >>
好消息,坏消息…
好吧,这对Bob来说是个坏消息,他既没有时间也没有愿望去开发这种精心设计的、复杂的获胜策略。那么Alice呢?Libratus似乎毫不费力地逼近的最优策略看起来一点也不容易。而且事实也并非如此。那么Alice怎么才能弄清楚呢?幸运的是,她不必这么做。
Alice不和Libratus玩扑克。Alice也不和世界上顶尖的玩家玩扑克。Alice和像Bob这样的人玩扑克,偶尔也和其他像她自己一样的玩家玩扑克。所有这些人都是根据诚实原则打牌的,几乎没有任何例外。
这个观点在Mathew Janda的高级策略书籍《无限注德州扑克的应用》的开头,Mason Malmuth和David Sklansky的介绍性声明中被阐明。他们的声明的标题是“关于抓诈唬的警告”,它本质上是一个关于在试图以防御的方式跟大注时,忽略诚实原则的后果的警告。
他们的声明试图完成的是警告读者,试图保护自己免受诈唬并不一定是利润最高的选择。对于大多数玩家诈唬的频率不够高的初学者和中级玩家来说尤其如此。
Alice可以通过偶尔叫牌来确保Bob保持诚实,以让他保持警惕。但如果Bob已经比他应该的诈唬频率更低,Alice的每次叫牌从长远来看都是输的。根本不叫牌对她更有利。
当然,通过从不叫Bob的大注,Alice让自己面临着Bob可能理论上开始利用她,增加他的诈唬频率的可能性。作为一个试图优化解决比赛的人,这正是Janda的观点。如果Alice停止叫牌,Bob可能会在理论上利用她。
当然,Malmuth和Sklansky的反驳是,大多数Bob还不够好,无法意识到这一点,因此不太可能做出调整。我完全同意。Bob不是Libratus,谢天谢地!
作为另一个例子,Dan B.在他的优秀文章《3个在实践中输掉的理论上赢的牌》中提出了类似的观点。用他的话说:
虽然一个大的盖牌并不是扑克中最性感的玩法,但它通常是正确的玩法。
转述Andres“educa-p0ker”Artinano(也出现在这篇文章中)的话:
…能够提升赌注的“盖牌者”。
下周请留意本文章系列的第三部分也是最后一部分。
如果您想粉碎您的家庭游戏或当地赌场,那么请不要犹豫,看看7美元的翻后战术手册。这个快速的速成课程将教你一个经过验证的扑克获胜系统,在不到2小时内。
没有这个7美元的工具,不要再玩任何一手牌了
以如此低廉的价格,7美元的翻后战术手册是一个不需要动脑筋的选择,如果你想确定你的基本功……
…并建立更大的资金。